EVOC 20 PolySynth (U/V) Detektor-Parameter

Die menschliche Sprache besteht aus stimmhaften (voiced) Lauten (tonale Klänge oder Formanten) und stimmlosen (unvoiced, U/V) Lauten. Der Hauptunterschied ist, dass stimmhafte Laute durch Schwingungen der Stimmbänder erzeugt werden, während stimmlose Laute durch das Formen von Luftströmen (Rauschen) mit Lippen, Zunge, Gaumen, Rachen und Kehlkopf gebildet werden.

Wenn also in einem Vocoder Sprache mit stimmhaften und stimmlosen Lauten als Analysesignal verwendet wird, im Syntheseteil aber nicht zwischen stimmhaften und stimmlosen Lauten unterschieden wird, leidet die Sprachverständlichkeit des synthetisierten Signals. Der Synthesis-Bereich des Vocoders muss also verschiedenartige Klänge für die stimmhaften und stimmlosen Signalanteile erzeugen.

Aus diesem Grund umfasst der EVOC 20 PolySynth einen Unvoiced/Voiced-Detector. Dieser Schaltkreis erkennt die stimmlosen Abschnitte im Analyse-Eingangssignal und ersetzt sie in den entsprechenden Abschnitten des Synthese-Signals durch Rauschen, durch eine Mischung aus Rauschen und dem Synthesizer-Signal oder durch das Originalsignal. Erkennt der U/V-Detector hingegen stimmhafte Laute (voiced), lässt er das normale Synthesesignal passieren.

Ein Formant ist eine Betonung im Frequenzspektrum eines Klangs. Auf die menschliche Stimme bezogen sind Formanten das, was uns das Unterscheiden verschiedener Vokale aufgrund der Verstärkung oder Ausfilterung dieser Klänge ermöglicht. Die Formanten der menschlichen Sprache und des Gesangs werden durch den Vokaltrakt bestimmt, wobei die meisten Vokalklänge vier oder mehr Formanten besitzen.

Abbildung. Parameter für „U/V Detection“

Parameter für „U/V Detection“